clockbench动漫

人工智能的盲点：世界顶级大模型在读取识别模拟时钟时间表现惨淡

当今最先进的人工智能模型能够在数学奥林匹克竞赛中夺得金牌，编程能力超越绝大多数专业开发者，却在一个看似简单的任务上遭遇滑铁卢——读取模拟时钟。一项名为ClockBench的新基准测试揭示了人工智能领域的一个令人尴尬的现实：即使是最前沿的AI系统，在这项六岁儿童

AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench，专注于测试AI的「看懂」模拟时钟的能力。